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数字 人 文 视角 下 学 术 名 人 知识 模型 构建 研究 


以 李 政 道 数 字 资 


目 刘 宁 静 ” 刘 音 ” 王 莫言 ” 郭 晶 
上 海 交 通 大 学 图 书馆 ”上海 200240 


摘要 : [目的 /意义 ] 以 数字 人 文 需求 为 牵引 ,从 知识 的 角度 有 效 组织 学 
[方法 /过 程 ] 通 过 分 析 学 术 名 人 特色 资源 特征 和 用 户 使 用 需求 ,调研 分 析 4 


机 构 开 展 知识 服务 提供 资源 支撑 。 


营 源 中 心 为 例 


术 名 人 资源 ,为 图 书馆 等 公共 文化 


类 以 人 物 为 核心 的 特色 资源 库 知识 模型 ， 学 术 名 人 ) 为 核心 ,以 资源 为 载体 ,构建 学 术 名 人 描述 框架 模 


型 和 学 术 名 人 与 其 他 实体 关系 模型 。[ 结 


结论 ] 在 学 术 名 人 知识 模型 的 基础 上 链接 外 部 数据 ,能 够 对 以 李 政 


道 特色 资源 为 代表 的 学 术 名 人 特色 ， 颗粒 的 角度 进行 有 效 的 组 织 和 展示 。 


< 一 关键 词 : 知识 模型 ”知识 组 织 
六 分 类 号 : G254 
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学 术 名 人 数字 人 文 


当前 , 随 着 信息 技术 的 深入 发 展 和 用 户 需 求 的 不 
断 炙 化 ,现代 图 书馆 呈现 出 从 文献 服务 向 知识 服务 转 
型 < 从 数字 图 书馆 向 智慧 图 书馆 发 展 的 趋势 。 数 字 人 
大 ADisital Humanities ) 起 源 于 人 文 计算 ( Humanity 
Cosiputing) ,是 一 个 快速 发 展 的 跨 学 科研 究 与 应 用 领 
域 ;得 图 书馆 开展 知识 服务 的 一 个 重要 方向 。 经 过 几 
十 宇 研 究 和 应 用 ,其 内 涵 也 在 逐渐 发 展 。 王 晓 光 认为 
数 备 人 文 的 主要 范畴 是 改变 人 文 知识 的 发 现 ( Discove- 
tia .标注 ( Annotating) 、 比 较 ( Comparing) .引用 (Re- 
ferring) 、 取 样 (Sampling ) 、 曾 释 ( Jlustrating ) 与 呈现 
( Representing) ,实现 人 文 研究 与 教学 的 升级 和 创新 发 
刘炜 等 认为 数字 人 文 的 本 质 是 方法 和 工具 的 
变革 ,新 兴 的 数据 技术 带 来 知识 单元 的 细 粒 度 化 , 知 
识 组 织 的 语义 化 ,知识 呈现 的 可 视 化 ,为 人 文 研究 提 
供 了 前 所 未 有 的 强大 工具 2 。 郭 唱 对 国外 数字 人 文 
研究 演进 及 发 展 动向 进行 了 深入 研究 ,认为 数字 人 

文 已 经 不 仅仅 是 指 人 文 资料 载体 的 数字 化 、 网 络 化 
与 计算 机 应 用 ,更 多 是 指 一 种 以 pe 
式 , 在 “后 数字 时 代 ” 的 物理 实体 与 数字 媒体 这 两 


领域 开展 的 双向 互动 ”1 。 

以 图 书馆 丰富 的 馆藏 资源 和 结构 化 的 元 数据 记 
录 为 基础 ,借助 现代 信息 技术 为 人 文 研 究 者 提供 新 
的 研究 视角 、 研 究 方法 和 研究 工具 ,是 图 书馆 的 优势 
所 在 ,也 是 使 命 所 在 ,既是 机 遇 , 也 是 挑战 所 。 越 来 
越 多 的 图 书 销 在 馆藏 资源 数字 化 建设 的 基础 上 ,期 
望 通过 数据 管理 技术 构造 数字 人 文 服 务 系统 ,通过 
数据 分 析 技 术 构 造 数字 人 文 应 用 平台 "”" 。 而 知识 表 
示 ,组 织 与 关联 是 进行 数据 管理 的 一 项 关键 技术 ,是 
把 资源 变数 字 化 为 数据 化 并 进一步 知识 化 的 关键 问 
题 ,是 对 海量 资源 从 人 文 角度 进行 定量 分 析 的 基础 
工程 。 

学 术 名 人 特色 资源 是 近年 较为 重要 的 一 类 特 藏 资 
源 , 越 来 越 多 的 图 书馆 ,博物馆 、 档 案 馆 等 文化 和 社会 
记忆 机 构 以 人 物 尤 其 是 学 术 名 人 为 核心 ,收集 .整理 和 
保存 专题 资料 ,并 在 此 基础 上 建设 图 书馆 .纪念 馆 、 专 
题 资 料 室 和 专题 数据 库 等 ,如 上 海 交通 大 学 李 政 道 图 
书馆 、 钱 学 森 图 书馆 ,西南 大 学 侯 光 炯 纪 念 馆 、 北 京 大 
学 图 书馆 陈 输 笔 档案 资料 库 ,清华 大 学 科恩 图 书 室 、 各 
高 校 档案 馆 收 集 的 名 人 档案 资料 等 。 这 类 资源 不 仅 特 
点 鲜明 ,价值 突出 ,而 且 体 量 巨 大 ,包括 各 类 与 学 术 名 
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人 相关 的 资料 ,文献 等 海量 资源 。 要 在 这 类 海量 资源 
的 基础 上 进行 研究 ,需要 对 其 进行 知识 表示 ,首先 需要 
建立 学 术 名 人 知识 模型 ,进而 构建 知识 组 织 模型 ,对 此 
类 资源 的 知识 进行 有 效 组 织 从 而 实现 资源 的 深入 分 
析 ,挖掘 和 展示 。 可 以 说 ,研究 和 构建 学 术 名 人 知识 模 
型 ,是 在 数字 人 文 视角 下 进行 研究 的 前 提 和 基础 ,已 经 
成 为 一 个 重要 的 研究 课题 ,具有 重要 的 理论 意义 和 实 


2 几 类 以 人 物 为 核心 的 特色 资源 知识 


模型 调研 分 析 
对 以 人 物 为 核心 的 资源 中 与 名 人 、 学 术 相 关 资 源 


的 知识 模型 进行 调研 ,对 构建 学 术 名 人 知识 模型 具有 
人 参 券 和 借鉴 意义 。 下 文 将 对 当前 以 人 物 为 核心 的 资源 
虹 甬 为 有 代表 性 的 知识 模型 进行 调研 , 主要 关注 其 折 
篆 开 来 的 概念 实体 和 实体 间 关 系 , 以 帮助 构建 学 术 名 
识 模型 。 这 4 类 模型 为 :脱胎 于 社会 化 网 络 在 线 
资源 的 FOAF .名 人 传记 类 资源 CBDB 的 知识 模型 、 上 
海 图 书馆 名 人 手稿 档案 资源 知识 模型 ,学 术科 研 信息 
资 疯 CERIF。 
知识 表示 是 人 工 智能 (AI) 的 一 个 重要 分 支 和 研 
咒 铬 域 , 是 实施 知识 工程 .开展 知识 服务 的 关键 问题 。 
党 究 对 于 知识 表示 已 进行 了 较为 深入 的 研究 ,但 对 什 
么 是 知识 表示 目前 尚 无 统一 严格 的 定义 。 总 体 来 说 ， 
知 活 表示 主要 研究 如 何 将 知识 以 计算 机 可 接受 的 形式 
进行 描述 和 存储 ,并 进一步 加 以 有 效 的 利用 。 从 本 质 
紫 说 ,知识 表示 是 面向 计算 机 的 对 知识 进行 符号 化 、 
形 搭 化 .结构 化 的 过 程 。 常 用 的 知识 表示 方法 有 谓词 
馆 辑 表示 法 ,语义 网 络 知识 表示 .框架 表示 法 、 面 向 对 
象 表示 法 ,本体 表示 法 等 。 在 当今 的 知识 工程 实践 过 
程 中 ,本 体 表示 法 的 应 用 越 来 越 广泛 ,本 次 调研 的 4 类 
模型 大 多 为 本 体 模型 。 
2.1 ”社会 化 网 络 在 线 资源 :FOAF 

FOAF ( Friend of a Friend) (http://www. foaf -pro- 
ject. org/ ) 由 D. Brickley 和 LL.， Miller 于 2000 年 启动 ， 
广泛 应 用 于 以 用 户 集聚 为 特征 的 在 线 社区 ,社交 网 络 
等 资源 ,其 本 质 是 描述 个 人 的 一 个 简单 本 体 '"。FOAF 
定义 了 一 套 RDF 词汇 集 来 描述 用 户 . 用 户 兴 趣 、 用 户 
关系 和 活动 。 词 汇集 主要 包括 类 ( Class) 和 属性 ( Prop- 
erty ) 两 种 ,分 为 核心 集 ( Core) 和 社交 网 络 集 ( Social 
Web ) 两 类 ,核心 集 主要 包含 描述 基本 核心 信息 的 类 和 
属性 (共计 19 个 ) ,社交 网 络 集 主要 包含 描述 社交 网 络 
相关 信息 的 类 和 属性 (共计 25 个 ) 。FOAF 主要 对 A- 
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gent ,Project 和 Document 这 三 个 实体 进行 描述 ,每 个 实 
体 包括 若干 属性 。FOAF 的 知识 模型 可 简单 抽象 如 图 
1 所 示 : 


1 FOAF 知识 模型 示意 


从 图 1 可 以 看 到 ,FOAF 的 知识 模型 主要 面向 网 络 
资源 围绕 人 、 文 献 和 项 目 进 行 构 建 ,但 是 对 于 人 与 人 之 
间 、 人 和 文献 之 间 、 人 和 项 目 之 间 的 关系 并 没有 进行 足 
够 的 描述 。 无 法 满足 对 内 容 进 一 步 深 入 挖 气 和 分 析 的 
需求 。 

2.2 名 人 传记 类 资源 :CBDB 

中 国 历代 人 物 传记 资料 库 ( CBDB ) (https://pro- 
jects. iq. harvard. edu/chinesecbdb ) 是 一 个 以 系统 地 收 
录 中 国 历史 上 所 有 重要 传记 资料 为 目标 的 线 上 关系 型 
数据 库 。 由 部 若 贝 (R. M. Hartwell) 教授 于 1980 年 代 
开始 建立 ,目前 由 哈佛 大 学 费 正 清 中 国 研 究 中 心 .中 研 
院 历 史 语 言 研究 所 及 北京 大 学 中 国 古 代 史 研究 中 心 三 
方 合作 共同 开发 ” 。 

CBDB 将 人 物 视 为 社会 中 的 人 ,将 人 物 的 人 生 经 
历 转化 为 模型 ,以 人 为 实体 进行 知识 组 织 , 采 取 模 型 化 
记录 的 方式 ,使 其 能 够 被 关系 网 络 界 定 、 量 化 和 分 
析 。CBDB 在 世间 各 种 相互 关联 的 复杂 实物 之 间 建 
立 多 种 形式 的 关系 ,将 世间 事物 抽象 为 实体 的 类 , 实 
体 的 对 象 和 实体 对 象 间 的 关系 ,并 用 二 维 表格 的 形 
式 存储 和 表示 这 些 实体 和 实体 间 关 系 。CBDB 的 知 
识 模型 见 图 2。 

从 图 2 可 以 看 出 CBDB 在 其 资源 所 具备 的 时 代 特 
点 的 基础 上 ,对 人 与 人 之 间 的 关系 进行 了 较为 详尽 的 
描述 。 

2.3 名 人 手稿 档案 资源 :上 海 图 书馆 
上 海 图 书馆 (以 下 简称 上 图 ) 名 人 手稿 档案 库 (hr- 


个 


tp://sg. library. sh. cn/ mrsg/ipwarning/ nopage ) 是 一 
面向 数字 人 文 研究 和 知识 服务 的 数据 库 , 以 24 万 余 种 
盛 宣 怀 档案 及 其 他 大 量 近 现代 名 人 的 手稿 和 档案 为 资 
源 基 础 建设 而 成 。 该 数据 库 通 过 构建 名 人 手稿 档案 本 
体 来 进行 知识 表示 。 该 本 体 在 深入 研究 上 图 名 人 手稿 


刘 宁 静 , 刘 音 , 王 莫言 ， 
工作 ,2019 ,63(23):113 -121. 


等 . 数字 人 文 视 角 下 学 术 名 人 知识 模型 构建 研究 


Chin 


以 李 政道 数字 资源 中 心 


类, 命 入 


姓名 | 性 别 | 生 


| 指数 年 | 


作者 | 出 版 者 | 编纂 者 | 
校对 者 | 翻译 者 | 注释 者 


基本 资料 


Ce enn xe 主 
系 改 型 


亲属 关系 ;: 母 | 女 | 兄弟 … 
非 亲 属 关 系 : 丧事 | 馈赠 礼物 


入 仕 关 系 : 荫 补 … | 


籍贯 1 迁居 1 赴任 1 安葬 … 


图 2 CBDB 知识 模型 示意 


档案 资源 的 基础 上 ,抽象 概念 ,分 析 特 征 ,厘清 概念 间 
关 过 ,构建 本 体 模 型 见 图 3。 该 本 体 包含 4 个 类 和 
9 友人 外 属性" ,基于 美国 国会 图 书馆 的 书目 框架 ( BIB- 
FRAME2.0 ) 进行 设 计 , 同 时 复 用 FOAF、Geonames、Or- 
i .PROV Schema TIME 等 本 体 中 的 类 ,新 建 上 
图 术 体 18 个 类 。 上 图 名 人 手稿 档案 本 体 知识 模型 将 
KK 转 时间、 地 点 .事件 等 知识 通过 文献 连接 起 来 ,形成 
多 式 化 的 ,机 器 可 读 的 立体 的 知识 网 络 。 同 样 由 于 
其 欧 人 手稿 资源 自身 特性 ,该 知识 模型 对 近 现 代 人 物 
的 便 征 描述 得 较为 详细 ,文献 方面 则 偏重 于 手稿 .信函 
等 档案 资料 的 描述 。 


>< i 
人 
SC 从 地) (信纸) 
[1 J . 
二 2 四 
© ~ 地 点 
藏书 村 一 
时间 | 
(G42) + 本 
A 
Ty (和 有 


3 ”上 图 名 人 手稿 档案 本 体 模 型 "" 


2.4 学 术科 研 信 

CERIF (the Common European Research Information 
Format ) ( https :AAwww. eurocris. org/ ) 是 应 用 于 科研 信 
息 管理 系统 的 一 个 概念 模型 标准 ,由 EUROCRIS 开发 
而 成 。CERIF 知识 表示 模型 主要 包括 基本 实体 (Base 
Entities) 科研 成 果实 体 (Result Entities ) 、 二 级 实体 
(2nd Level Entities ) 、 基 础 设施 实体 (Tnfrastructure Enti- 


息 资 源 :CERIF 


ties) 等 。 基 本 实体 为 人 (Person) 组织 单 元 ( Organisati- 
onUnit) 和 项 目 (Project) ,是 开展 科研 活动 最 基础 的 三 
个 实体 。 科 研 成 果实 体 描 述 科 研 产 出 ,包括 出 版 物 
(ResultPublication ) 专利 (ResultPatent) 和 产品 (Result- 
Product) 等 。 二 级 实体 描述 科研 活动 相关 而 非 必须 的 
实体 ,包括 基金 .奖励 .简历 等 。 基 础 设施 实体 则 描述 
在 开展 科研 活动 时 使 用 的 设备 设施 。 详 细 模 型 见 图 
4。 可 以 看 到 该 模型 通过 二 级 实体 与 基本 实体 、 成 果实 
体 的 关联 ,成 果 和 基础 设施 实体 的 关联 ,基本 描述 了 科 
学 研究 的 全 流程 。 

通过 上 述 调研 可 知 ,这 4 类 资源 的 知识 模型 均 使 
用 本 体 法 进行 构建 ,FOAF 对 人 物 的 基础 信息 的 描述 较 
为 全 面 ;CBDB 对 人 物 间 关系 、 人 地 关系 的 描述 较为 深 
入 ;上 图 名 人 手稿 本 体 对 近代 人 物 特征 和 手稿 ,信函 等 
档案 类 文献 描述 详细 ; CERIF 则 较为 全 面 地 描述 了 基 
金奖 项 .设施 .成 果 等 学 术科 研 的 各 个 方面 。 这 4 类 
知识 模型 并 非 专门 针对 学 术 名 人 特色 资源 构建 , 虽 无 
法 同时 兼顾 此 类 资源 对 于 人 物 与 其 他 实体 间 关 系 和 学 
术科 研 关系 知识 描述 的 需求 ,但 对 学 术 名 人 特色 资源 
的 知识 模型 构建 有 参考 意义 。 


3 ”学 术 名 人 特色 资源 


3.1 资源 定义 

“学 术 ” 是 系统 的 专门 的 学 问 ,“ 名 人 ”是 指 著 名 的 
人 物 , 学 术 名 人 特 指 在 某 一 或 某 些 学 术 领 域内 取得 杰 
出 成 就 而 为 世人 所 知 的 著名 人 物 。 从 本 文 的 判定 标准 
来 说 ,主要 包括 各 类 国际 著名 学 术 奖 项 获得 者 ,如 诺 贝 
尔 奖 获得 者 李 政 道 杨振宁 等 ,或 虽 未 获得 国际 著名 学 
术 奖 项 ,但 获得 国家 最 高 奖项 是 为 国家 科技 进步 做 出 
日 越 贡献 ,在 国内 外 拥有 重要 学 术 影 响 的 人 物 ,如 钱 学 
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森 等 。 学 术 名 人 特色 资源 是 指 以 一 位 或 多 位 学 术 名 人 
人 
播 避 下 三 个 方面 ; 
加 (1 ) 从 资源 收集 的 角度 ,学 术 名 人 是 此 类 资源 收 
的 一 个 核心 标准 ,通常 以 本 人 或 家 属 捐赠 为 主 ,同时 
伴 留 资源 收藏 机 构 主动 的 \ 以 与 该 学 术 各 人 有 关 的 文 
献 诅 料 为 目标 的 征集 行为 。 
己 (2) 从 资源 组 织 与 揭示 的 角度 ,学 术 名 人 本 身 是 

资源 进行 组 织 和 揭示 的 核心 要 求 ,所 有 资源 在 对 
资源 本 身 进行 描述 的 基础 上 ,还 要 能 够 立体 、 全 面 地 揭 
示 该 学 术 名 人 的 方方面面 ,如 代表 性 的 著作 、 典 型 事 
件 .生平 履历 年 谱 、 人 物 社会 关系 等 。 

(3) 从 资源 保存 的 角度 ,此 类 资源 主要 围绕 学 术 
名 人 进行 存储 ,人 物 是 此 类 资源 的 核心 关键 元 素 。 
3.2 ”资源 特征 分 析 

学 术 名 人 特色 资源 是 图 书馆 特色 资源 中 较为 特殊 
的 一 类 。 和 一 般 的 名 人 手稿 .资料 相 比 ,往往 富 含 大 量 
具有 学 术 价值 .能 够 分 析 学 术 行为 的 文献 ;和 传统 的 图 
书馆 资源 相 比 ,无 论 是 在 资源 类 型 ,载体 .内容 .主题 竺 
方面 ,都 具有 更 为 复杂 的 特性 。 

(1) 资 源 类 型 多 样 化 。 学 术 名 人 特色 资源 以 文献 
为 主 ,不 过 是 一 个 “大 文献 "的 概念 。 首 先 体现 在 资源 
类 型 与 第 一 手 研究 资料 众多 ,按照 载体 形式 可 大 致 将 
其 分 为 纸 质 文献 .实物 , 声 像 资料 三 类 。 纸 质 文献 是 以 
纸张 为 载体 ,以 文字 说 明 为 主要 记录 方式 形成 的 历史 记 


116 


ji MN NN Xe Rt 


VA WS {NZ 
"Ca NN 2 | 
NN2 PS SS 区 2 SA 


Ft 
je fe 


A fs 
EN PR 


ee 
RL 


| eon | 


全 二 
名 


图 4 CERIF 知识 模型 


录 , 包 括 :信函 、 手 稿 .讲义 、 论 文 .图 书 、 图 像 . 其 他 纸 质 
文献 等 。 声 像 资料 是 以 磁性 材料 或 感光 材料 等 为 载体 ， 
主要 以 声音 和 图 像 为 主要 记录 方式 形成 的 历史 记录 , 包 
括 :照片 音频 ,视频 等 。 实 物 是 指 除 文献 和 声 像 资料 以 
外 的 ,与 学 术 名 人 有 关 的 ， ee hd 
代表 性 实物 ,包括 :奖章 证 书 、 艺 术 品 \ 纪 念 品 乞 

(2) 资 源 关 系 多 角度 。 资源 与 学 术 名 人 的 关系 有 
多 种 类 型 ,可 能 是 学 术 名 人 自己 撰写 、 创 作 的 文献 资 
料 ; 可 能 记录 或 见证 学 术 名 人 工作 ,生活 各 个 方面 的 重 
要 资料 和 实物 ;可 能 是 宣传 和 传播 学 术 名 人 精神 的 新 
闻 报道 ,与 学 术 名 人 重大 历史 事件 相关 联 的 资料 和 实 
物 等 ;还 可 能 是 内 容 上 与 学 术 名 人 关系 不 大 甚至 毫 无 
关系 ,但 是 却 为 名 人 所 拥有 收藏 ,在 一 定 程 度 上 反映 
其 个 人 趣味 的 其 他 资料 。 

(3) 内 容 主 题 有 线索 。 资 源 的 内 容 围绕 学 术 名 人 
展开 ,其 主题 离 不 开 该 学 术 名 人 的 学 术 地 位 、 生 平 经 
历 、 重 大 事件 .生活 意趣 等 。 对 其 主题 的 深入 揭示 要 建 
立 在 对 该 学 术 名 人 的 深入 了 解 和 研究 的 基础 上 。 

(4) 资 源 性 质 跨 领域 。 不 同类 型 的 资源 所 涉及 的 
研究 领域 不 同 , 前 人 对 其 进行 研究 的 程度 和 侧重 点 也 
不 同 。 如 手稿 .图书 等 纸 质 文献 属于 传统 图 书馆 学 研 
究 范 畴 ,而 奖章 .艺术 品 等 实物 资源 属于 传统 博物 馆 学 
研究 范畴 ,照片 ,财务 报表 等 资源 属于 传统 档案 学 研究 
范畴 ,学 界 对 前 者 的 知识 组 织 研究 较 多 ,对 后 两 者 的 研 
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3.3 ”资源 使 用 需求 分 析 

从 资源 的 使 用 需求 来 说 ,用 户 对 此 类 资源 的 利用 
需求 是 跨 领域 .全 方位 的 ,主要 有 以 下 三 个 方面 ; 

(1) 科 学 研究 需求 。 学 术 名 人 以 学 术 成 就 闻名 ， 
所 做 的 学 术 研 究 及 成 果 都 是 卓 有 价 值 的 ,很 多 是 开创 
性 的 经 典 的 研究 工作 ,相关 论文 专著. 学术 手 稿 .讲义 
等 资料 对 于 后 学 者 有 着 重要 的 参考 .借鉴 和 启发 意义 ， 
这 就 需要 对 同一 领域 的 资料 进行 聚 类 以 供 学 习 者 和 研 
究 者 参考 。 

(2) 史学 研究 需求 。 从 史学 的 角度 对 该 学 术 名 人 

进行 研究 ,如 研究 学 术 各 人 的 学 术 合作 关系 和 其 他 社 
会 关系 ,对 一 些 重要 事件 的 史实 资料 进行 文本 分 析 , 对 
学 术 名 人 的 重要 经 历 和 重大 事件 进行 时 空 分 析 等 。 
一 (3) 精 神 价值 的 展示 与 传播 需求 。 学 术 名 人 一 般 
都 旧 有 较 高 的 精神 价值 , 需 在 特色 资源 的 基础 上 ,结合 
其 甬 神 特质 进行 深度 挖掘 和 可 视 化 展示 ,从 而 达到 文 
值 传播 的 目的 。 
加 通过 分 析 学 术 名 人 特色 资源 的 特征 和 使 用 需求 ， 
可 适 , 此 类 资源 的 知识 主要 聚焦 于 人 (包括 人 物 .机构 、 
团 聊 ) 地. 时事 和 资源 ( 纸 质 文献 . 声 像 资 料 . 实 物 ) 
班 相 类 基本 实体 。 学 术 名 人 特色 资源 是 以 人 物 为 核心 
的 给 源 中 较为 特殊 的 一 类 。 


4 ”学 术 名 人 知识 模型 构建 


光 祭 合 考虑 资源 特征 和 使 用 需求 ,参考 FOAF、CB- 
DB 上 图 名 人 手稿 档案 .CERIF 四 类 知识 模型 的 构建 
方法 ,对 学 术 名 人 特色 资源 的 相关 实体 概念 进行 抽象 


和 擂 述 ,可 以 构建 学 术 名 人 特色 资源 知识 模型 ,在 此 模 


为 载体 ,将 人 地 . 事 .时 等 知识 进行 组 织 。 由 于 篇 幅 所 
限 ,本 文 仅 研 究 学 术 名 人 知识 模型 的 构建 ,包括 学 术 名 
人 描述 框架 模型 和 学 术 名 人 与 其 他 实体 关系 模型 两 个 
方面 的 内 容 。 前 者 用 来 提取 和 标记 学 术 名 人 各 个 维度 
的 基本 知识 ,后 者 用 来 与 其 他 实体 进行 关联 ,进一步 形 
成 知识 网 络 供 深度 挖掘 和 利用 。 
4.1 学 术 名 人 描述 框架 模型 

学 术 名 人 因 在 专业 领域 取得 杰出 成 就 而 闻名 , 具 
有 鲜明 的 学 术 特征 ; 因 其 为 名 人 ,具有 鲜明 的 社会 特 
征 ;同时 还 具有 作为 普通 人 的 基本 特征 。 对 学 术 名 人 
本 和 映 的 基本 特征 进行 描述 ,有 助 于 从 知识 的 角度 聚合 、 


据 所 描述 的 工作 信息 ,可 以 挖掘 该 学 术 名 人 的 学 术 合 
作 同事 关系 等 ,分 析 和 展示 其 学 术 影响 力 ;根据 所 描 
述 的 研究 领域 信息 ,可 以 按 研 究 领 域 聚合 该 学 术 名 人 
的 论文 著作、 手稿 等 研究 成 果 , 满 足 研究 者 的 科学 研 

FOAF 对 社会 网 络 中 的 人 物 基本 特征 进行 了 描述 ， 
把 Agent 类 分 为 Person、Organization 和 Group 三 个 子 
类 , 其 中 Person 子 类 用 name、plan 、currentProject、 


schoolHomepage ,img workplaceHomepage ,knows 等 多 个 
属性 进行 描述 。CBDB 对 “ 人物” 实体 具体 描述 了 姓 
名 性别 . 生 浴 日 期 、 种 族 , 和 郡 望 .指数 年 在世 年 等 属 
性 。 上 图 名 人 手稿 本 体 在 FOAF 和 CBDB 的 基础 上 根 
据 近代 名 人 的 特点 重点 描述 了 名 人 的 社会 特征 。 
CERIF 则 对 人 物 学 术 特 征 进 行 了 较为 详细 的 描述 。 综 
合 考虑 学 术 名 人 的 学 术 性 .时代 性 等 特点 ,参考 FOAF、 
上 图 名 人 手稿 .CERIF 对 人 物 描述 的 框架 模型 ,可 将 学 
术 名 人 的 基本 知识 描述 归纳 为 基本 信息 ,教育 信息 、 工 
作 信 息 、 研 究 信息 和 荣誉 信息 五 个 方面 : 

(1) 基 本 信息 包括 姓名 、 性 别 、 出 生日 期 \ 出 生地 、 
国籍 籍贯、 民族 、 照 片 \ 履 历 等 。 

(2)] 教 育 信 息 包 括 人 物 所 就 读 的 学 校 、 入 校 时 
司 、 离 校 时 间 、 离 校 状态 ( 毕业、 结业 、 刍 业 ) 、 获 得 的 学 
位 所 学 的 专业 指导 老师 等 。 

(3) 工 作 信息 包括 人 物 的 工作 单位 .工作 时 间 、 工 
作 方 式 、 职 务 职称 、 工 作 描述 等 。 

(4) 研究 信息 包括 研究 领域 .研究 成 果 、 研 究 项 
目 . 重 大 贡献 等 。 

(5 ) 琳 誉 信息 包括 获奖 信息 、 头 衔 社会 兼职 所 

学 术 名 人 描述 框架 模型 可 以 用 XML 形式 化 表示 ， 
见 图 5。 
4.2 ”学术 名 人 与 其 他 实体 关系 模型 

对 学 术 名 人 与 其 他 实体 间 关 系 建立 模型 ,有 助 于 
抽取 关系 进行 深入 挖掘 .分 析 和 展示 。 参 考 FOAF 实 
体 关 系 描述 ,CBDB 对 人 与 人 、 人 与 地 关系 的 描述 ,上 
图 本 体 对 人 与 手稿 档案 类 文献 及 其 事 、 地 、 时 关系 的 描 
述 ,CERIF 中 人 与 科研 全 流程 的 描述 ,学 术 名 人 与 人 、 
地 时、` 事 资源 五 类 实体 的 关系 可 以 描述 如 下 : 

(1) 学 术 名 人 (同时 也 是 核心 人 物 ) 与 “人 ”的 关系 
包括 与 ”人 物 ” 的 关系 和 与 “机 构 / 团 体 ” 的 关系 。 学 术 
名 人 与 其 他 人 物 之 间 通 过 “关系 ”进行 连接 ,这 种 关系 


挖掘 资源 ,并 进行 可 视 化 展示 。 如 根据 所 描述 的 教育 
信息 ,可 以 挖掘 该 学 术 名 人 的 校友 、 同 学 .老师 等 关系 ， 
同时 结合 外 部 数据 ,对 其 教育 经 历 进行 时 空 分 析 等 ; 根 


可 能 是 亲属 关系 ,如 父母 . 兄 .弟子 \ 女 配偶 等 ;可 能 
是 师承 关系 ,如 导师 老师. 学生、 同学 等 ;可 能 是 学 术 
关系 ,如 合作 关系 元 争 关系 等 ;还 可 能 是 行政 关系 ,如 


117 


团 浊 情报 三 作 


第 63 卷 第 23 期 2019 年 12 月 


ChinaXiv 合 作 期 刊 


famousScholarContainerType 


famousScholarContainer 日 


—— EH famousScholarGroup 日 


famousScholarGroupType 


一 中 famousScholar 口 


famousScholarType 


基本 信息 口 


学 术 名 人 集群 


学 术 名 人 


学 术 名 人 个 体 


[教育 信息 申 
门 工 作 信息 中 
门 | 研究 信息 申 
[荣誉 信息 申 
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{个 团体 或 机 构 中 的 上 级 与 下 级 关系 ;此 外 ,还 有 可 
能 是 尚未 描述 的 其 他 关系 , 供 以 后 扩展 补充 。 学 术 名 
全 机构 之 间 的 关系 也 较为 丰富 ,如 求学 ,任职 ,兼职 、 
的 如 推动 访问 .成 员 等 。 

(2) 学 术 名 人 与 “地 "(地 点 或 地 址 ) 之 间 的 关系 除 
下 BDB 所 定义 的 籍贯 .迁居 赴任、 安 莫 等 关系 外 ,还 
有 学 术 名 人 所 特有 的 参 会 .访问 ,参观 .出游 等 ,而 与 
“了 产生 关系 的 同时 ,一般 也 会 与 “ 事 ” 相 关联 。 
(3) 学 术 名 人 与 其 相关 的 重要 事件 也 需要 揭示 出 
来 届时 又 通过 这 些 事件 与 时 间 .人 物 关联 ,并 且 , 对 与 
本 


图 5 学 术 名 人 描述 框架 模型 


关联 ,成 为 该 事件 的 忠实 记录 与 佐证 。 

(4) 学 术 名 人 与 资源 的 关系 。 从 大 的 方面 来 说 ， 
学 术 名 人 可 以 是 资源 的 创建 者 .或 者 是 资源 的 所 有 者 ， 
或 者 仅仅 与 资源 的 具体 内 容 有 关系 。 以 纸 质 资源 为 
例 ,学术 名 人 可 能 是 纸 质 文献 的 责任 者 ,责任 方式 为 作 
者 、 编 篆 者 .翻译 者 .所 有 者 、 收 信人 发 信人 等 。 或 者 
该 纸 质 文献 是 关于 学 术 名 人 的 新 闻 报 道 、 传 记 、 引 用 资 
料 等 ,并 且 可 以 将 内 容 中 所 绚 仿 的 情感 倾向 进行 标记 
和 提取 。 

学 术 名 人 与 其 他 实体 关系 模型 如 图 6 所 示 : 


亲属 关系 : 父母 上 子 | 作者 1 编纂 者 | 翻译 者 | 所 
女 1 兄 1 弟 … 


有 者 | 收 信人 | 发 信人 


关系 : 导师 | 老师 
生 | 同 学 
学 术 关 系 ; 合作 | 竞争 
行政 关系 ; 上 级 1 下 级 
其 他 关系 


职 | 创建 | 推动 1 访问 | 成 员 …| 


类 型 一 和 | 新 闻 报道 | 传记 | 引用 … 


中 文 姓名 | 英文 姓名 | 论文 
署名 1 姓名 1 拼音 1 别名 


籍贯 | 迁居 | 赴任 | 安 茸 | 参 会 | 
访问 1 参观 1 出 游 |… 


图 6 学 术 名 人 与 其 他 实体 关系 模型 示意 
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等 . 数字 人 文 视 角 下 学 术 名 人 知识 模型 构建 研究 


hina%iM 售 售 期 天 


以 李 政 道 数 字 次 注定 


5 形式 化 与 实例 化 一 一 以 李 政 道 为 例 


李 政 道 是 一 位 典型 的 学 术 名 人 ,是 开创 华人 获 详 
贝尔 奖 历史 的 物理 巨 璧 ,是 推动 中 国 科技 教 育 事业 发 
展 的 炎黄 赤子 ,还 是 倡导 科学 与 艺术 交融 的 智慧 使 者 ， 


李 政 道 先 生 的 学 术 成 果 档案 文献 等 毕生 资料 具有 重 
要 的 学 术 价 值 、 精 神 价值 和 历史 意义 。2011 年 , 李 政 
道 先 生 将 其 毕生 资料 捐赠 给 上 海 交 通 大 学 李 政 道 图 书 
馆 。2013 年 ,在 对 这 些 资 料 进 行 数字 化 、 组 织 和 揭示 


ed de 从 史记 、 物 : 
理 \. 授 : 业 、 科 … 艺 .实时 5 个 维度 对 李 政 道 特色 资 
源 进行 深度 组 织 合 , 并 进行 可 视 化 展示 。 近 年 来 ， 


ee 日 益 
增多 的 背景 下 李 政 道 图 书馆 也 在 寻求 使 用 新 的 方法 
和 拷 术 手段 ,从 知识 的 角度 对 该 网 站 进行 改版 和 完善 。 
李 政 道 描述 框架 实例 化 
CO 资源 描述 术 框 架 ( Resource Description Framework , 简 
称 RDF) 是 一 个 用 于 描述 Web 资源 的 通用 框架 "”, 通 
元 人 资源 属性 - 信 的 素 式 对 资源 进行 所 
机 ss RDF FP 数据 具有 易 控制 、 易 扩展 、 


易 综合 以 及 高 包容 性 和 可 交换 性 等 特 点 " ,此 外 还 可 
以 在 RDF 框架 内 进行 语义 检索 和 知识 推理 。 
根据 前 述 学 术 名 人 描述 框架 模型 ,对 李 政 道 先生 

的 基本 知识 按照 基本 信息 .教育 信息 、 工 作 信 息 、 人 研究 
信息 和 荣誉 信息 5 个 方面 进行 描述 。 基 本 信息 主要 包 
括 李 政 道 的 中 英文 姓名 发表 论文 署名 、 性 别 、 出 生日 
期 .出 生地 籍贯 .民族 .国籍 简介、 照片 等 。 教 育 信息 
包括 李 政道 先生 从 上 海 私 立 清 心中 学 附小 肆 业 到 取得 
芝加哥 大 学 博士 学 位 的 全 部 求学 历程 的 知识 信息 。 工 
作 信 息 包括 李 政 道 先 生 从 担任 芝加哥 大 学 约克 其 
(Yerkes ) 天 文 观察 站 研究 员 到 担任 哥伦比亚 大 学 讲 席 
教授 等 的 全 部 工作 经 历 。 研 究 信息 包括 李 政 道 先生 研 
究 领 域 ,在 该 领域 产生 的 各 种 类 型 研究 成 果 ,与 该 领域 
相关 的 研究 项 目 , 对 领域 所 做 的 贡献 等 。 荣 誉 信息 则 
包括 李 政 道 先生 获得 诺 贝尔 奖 、 爱 因 斯 坦 奖 等 的 获奖 
和 名 誉 学 位 .名誉 教授 、 院 士 .其 他 社会 兼职 等 头 


信息 ， 

衔 信 息 。 
以 五 大 信 ， 

先生 基本 信 


息 中 的 基本 信息 为 例 , 用 RDF 对 李 政 道 
息 的 描述 如 图 7 所 示 : 


WP :RDE 二 raf- Http i v3. 3 org/1999/02/22-rdf -syntar_nst” xnlns; rdfs="http://www. w3. sd A xmlns:foaf="http://xnlns. com/foaf/0. 17 


xmlns: sjtul="http: Nhttp: // wy. lib. sjtu. edu. cry ontology/” xnlns:shl="htt 
<rdf:Description rdf:about="http: /httpy A/ www, tdlee, lib, sjtu, edu. tntaloo/®. 

<foaf :name xml:lange=" en >Tsun yy LEE</foaf :name 

《foaf :nane xml:lange=" cn > 李 政 foaf:nane > 

《sjtul:Sienature’T. D. LEE</s it Signature> 

<foaf: gender male /foaf: gender 

<shl:birthday»1926-12-. 2 2 shl:birthday 

shl:birthPlace> 上 海 /shl:birthPlace 

shl:nativePlace 苏州 (/ shl: 0 oy 

shl:ethnicity) 况 CO/ shl: ethnic: 

<shl:nationality 美国 hl tty 


i 领域 的 页 ee 


现 
他 吕 信 所 ed 博士 后 科学 : SS 


HN 高 等 《CCAST ) 并 担任 主 人 
学 李 时 衣 技 记 和 时 汤 大 5 004 年 任 RIKEN-B 了 LL 研 究 中 心 名 誉 主任 。 


<foaf:img http: 人 ae sjtu. edu. cn/ img. jhed/foaf: img> 
三 J Dec rn i 


<s, ee 
天 年 11 月 中 目 生 江苏 苏州 人 ， 哥 伦比 亚 sy 租 措 美 竹 华裔 物理 字 家 ， 
ls 时 


p:// ww. library. sh. cv ont ology, 


相对 论 性 重 敲 子 碰撞 (RHIC ) | 
半 汰 冰 了 9 人 SP ， 并 得 到 
86 年 ， 0 大 和 和 的 二 要 ， 让 


jh 人 roduction> 


7 ”学术 名 人 描述 框架 实例 化 一 一 李 政 道 


5.2 ” 李 政 道 与 其 他 实体 关系 实例 化 

以 李 政 道 与 上 海 交 通 大 学 李 政 道 图 书馆 所 收藏 的 
特色 资源 为 基础 ,可 以 将 图 7 的 李 政 道 与 人 地 、 事 、 
时 ,资源 ( 纸 质 文献 .实物 、 声 像 资 料 ) 等 其 他 实体 关系 
模型 进行 实例 化 验证 , 详 见 图 8。 

图 8 示例 性 地 将 李 政 道 与 导师 费 米 .机 构 哥 伦比 
亚 大 学 .出 生地 上 海 .重大 事件 获得 诺 贝 尔 奖 ,通过 纸 
质 文献 .实物 、 声 像 资 料 等 各 类 资源 建立 实体 间 关 系 。 
5.3 ” 李 政 道 数字 资源 中 心 可 视 化 展示 

在 构建 李 政 道 描述 框架 模型 和 李 政 道 与 其 他 实体 
关系 模型 的 基础 上 ,可 以 对 李 政 道 特色 资源 进行 深入 
地 挖掘 分 析 和 展示 。 以 李 政 道 数字 资源 中 心 网 站 为 
例 , 抽 取 李 政道 教育 工作 和 荣誉 信息 ,结合 外 部 数据 

进行 时 空 分 析 , 展 示 李 政道 年 谱 时 间 轴 ;抽取 李 政 道 与 


其 他 人 物 的 关系 ,展示 李 政 道人 际 关系 网 络 ; 按 照 研究 
领域 聚合 并 展示 李 政 道 各 类 研究 成 果 及 学 术 影 响 力 ， 
见 图 9、 图 10。 


6 ”小结 和 展望 


本 文 以 数字 人 文 需求 为 牵引 ,在 调研 脱胎 于 社会 
化 网 络 在 线 资源 的 FOAF .名 人 传记 类 资源 CBDB 的 知 
识 模型 上 图 名 人 手稿 档案 资源 知识 模型 学 术科 研 信 
息 资源 CERIF 等 4 类 以 人 物 为 核心 的 特色 资源 库 知识 
模型 概念 实体 .实体 与 实体 间 关 系 描 述 的 基础 上 ,分 析 


学 术 名 人 特色 资源 特征 和 用 户 使 用 需求 ,并 在 此 基础 
上 进一步 设计 和 构建 了 包括 学 术 名 人 描述 框架 模型 和 


学 术 名 人 与 其 他 实体 关系 模型 在 内 的 学 术 名 人 知识 模 
型 ,并 使 用 资源 描述 框架 (RDF ) 进行 形式 化 ,以 李 政 道 
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任职 
人 ) 全 责任 方式 新 闻 报 道 
关系 类 型 讲 N 
A 亲 
哥伦比亚 Question of parity 情感 倾向 
大 学 a A 
weak interactions 《 李 政 道 . 杨振宁 
Enrico Fermi 雅 答 接受 诺 贝 尔 奖 金 》 
英文 全 名 创建 责任 者 
“和 CC 关于 
3 美 手 
费 米 d 名 称 | 一 ”基本 信息 
中 文 名 称 论文 署名 
A “英文 全 名 上 海 
李 政 道 < 
人 Car ) 获奖 时 间 (C1957 ) 
Tsung Dao LEE es 出 生 
出 谋 时 间 a 共同 获得 
1926 获得 诺 贝尔 奖 


图 8 学 术 名 人 与 其 他 实体 关系 实例 化 一 一 李 政 道 


理 [3] 


10” 李 政道 数字 资源 中 心 截图 一 一 物 ， 


数字 资源 中 心 为 实例 进行 验证 。 该 模型 以 人 物 ( 学 术 
名 人 ) 为 核心 ,以 各 类 资源 为 载体 ,将 人 、 地 、 事 \ 时 等 进 
行 组 织 ,能 够 从 知识 颗粒 的 角度 对 资源 进行 有 效 组 织 ， 
是 实现 资源 的 深入 分 析 ,挖掘 和 展示 的 坚实 基础 。 

后 续 将 在 跨 图 档 博 (Library，Archive，Museum, 简 
称 LAM) 的 视野 下 ,进一步 构建 学 术 名 人 特色 资源 中 
纸 质 文献 . 声 像 资 料 和 实物 三 大 类 资源 的 知识 框架 ,并 
深入 研究 其 知识 和 语义 推理 机 制 ,以 满足 用 户 对 此 类 


hl 
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资源 的 科学 研究 需求 、 史 学 研究 需求 精神 价值 传播 和 
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Research on the Knowledge Model Construction of Famous Scholars from the Perspective 
of Digital Humanism—— Take the Digital Resource Center of Tsung Dao Lee as an Example 
Liu Ningjing Liu Yin Wang Moyan Guo Jing 
Shanghai Jiaotong University Library, Shanghai 200240 


IAbstract: [Purpose/significance | Taking the digital humanities as the traction, and effectively organizing special 
colléctions of famous scholars from the perspective of knowledge, so as to provide resources support for the public cultural 
instifutions such as libraries to carry out knowledge services. [Method/process| By analyzing the characteristics of spe- 


ollections about famous scholars and user needs, this paper investigated four types of knowledge models of special 


tions with characters as the core and resources as the carrier, designed and constructed the knowledge models of fa- 
mous scholars. [ Result/conclusion |Linking external data based on the knowledge models of famous scholars can effec- 
tively organize and display special collections of famous scholars represented by the collections of Tsung Dao Lee from the 


perspective of knowledge particles. 


Keywords: knowledge model knowledge organization famous scholars digital humanities 
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